CCF BDCI 2018即将开赛,火热报名中!

阅读量:941
2018-10-16

如果你对大数据和人工智能充满憧憬

如果你对编程算法略有研究

如果你想快速学习数据科学技术

如果你想要拿offer和奖金到手软

如果你想给自己的实力一个权威证明

2018年只剩下2个月

你只有一场大数据竞赛值得参加

CCF BDCI 2018

你不可不知的最强赛事

你不能再错过的数据英雄梦想

大赛介绍

2018 CCF大数据与计算智能大赛(CCF BDCI 2018 ),由中国计算机学会(CCF)主办,教育部高等学校计算机类专业教学指导委员会、沈阳市人民政府指导。经过五年举办,累计吸引来自25个国家、1000余所科高校、1200余家企事业单位、80余所科研机构,已成为最具影响力的大数据赛事品牌之一。

CCF BDCI 2018立足国际化、产业化、普及化,将联合200余位专家院士、70余家合作单位,面向互联网、金融、通信、电商等方向,面向全球大数据及人工智能人才,发布算法赛、系统赛、方案赛、开放赛多道赛题。数据驱动,智见未来!

大赛赛程

# 不要等到下一秒再开始 #

全新赛道体验满满诚意

CCF BDCI 2018 分2个独立赛道

可选择多个赛道多个题目研究

【第一赛道】

算法题、方案题共6道,由优秀企业组织出题

赛题发布:8月29日

数据发布:9月5日

报名截止:10月18日

大赛初赛:9月5日-10月21日

大赛复赛:10月25日-11月11日

【第二赛道】

系统题、算法题、开放题共6道,由CCF专家联合企业共同出题

赛题&数据发布:9月25日

报名截止:11月8日

大赛初赛:9月25日-11月11日

【决赛嘉年华】

中国·沈阳,11月24日-11月25日

与顶尖大咖一决高下

参与年度大数据及AI领域最权威赛事

赛题发布

每一道都想报名!


第一赛道

01

赛题名称:《 自动驾驶三维点云分割 》

出题单位:阿里巴巴集团

技术方向: 目标提取, 无人驾驶

赛题背景:自动驾驶离不开对车辆周围环境中的车辆、行人和自行车等物体的三维感知。三维激光点云是实现三维感知不可或缺的数据源,本赛题要求对场景三维点云进行分割,这是实现三维感知的非常重要的一个环节。

任务描述:赛题要求参赛者给出测试数据中每个点的类别预测,共同探索针对自动驾驶的高效三维点云分割方案。

数据特色:面向自动驾驶的三维点云标注数据非常稀有,本赛题提供超过80000帧三维点云数据帧,标注成了八个类别:自行车,三轮车,小车,大车,行人,人群,未知障碍物和背景,为自动驾驶提供感知层次的信息。

02

赛题名称:《面向电信行业存量用户的智能套餐个性化匹配模型》

出题单位:联通研究院

技术方向:数据挖掘、分类预测

赛题背景:电信运营商推出大量的电信套餐用以满足用户的差异化需求,面对种类繁多的套餐,如何选择最合适的一款对于运营商和用户来说都至关重要,个性化推荐能够在用户没有明确目的的时候帮助他们发现感兴趣的新内容。

任务描述:此题利用已有的用户属性(如个人基本信息、用户画像信息等)、终端属性(如终端品牌等)、业务属性、消费习惯及偏好分匹配用户最合适的套餐,对用户进行推送,完成后续个性化服务。

数据特色:提供用户真实业务行为(已脱敏)。

03

赛题名称:《基金间的相关性预测》

出题单位:宜信大数据

技术方向:相关性预测,机器学习

赛题背景:指旺财富是宜信财富旗下平台,为高速成长的新锐中产人群提供基于目标的财富规划和咨询服务。基金作为投资理财的一个重要工具,是指旺财富关注的投资品种之一。而研究基金的特征和性质,则是形成正确投资规划的一个必要步骤,也是指旺财富投资研究团队正在进行的工作。

任务描述:参赛者需要根据给出的基金净值、基金业绩比较基准、对应指数行情、基金间相关性等数据,构建模型、算法进行训练。然后针对我们提供的测试样本,通过您的算法或模型预测出之后一段时间内基金间的相关性情况。

数据特色:赛题数据包括一批公募基金的复权净值收益率,各只基金对应的业绩比较基准的收益率,基金间的相关性数据,同时期的重要市场指数收益率等。

04

赛题名称:《汽车行业用户观点主题及情感识别》

出题单位:艾普深瞳

技术方向: 情感识别、自然语言处理

赛题背景:汽车厂商需要了解自身产品是否能够满足消费者的需求,但传统的调研手段因为样本量小、效率低等缺陷已经无法满足当前快速发展的市场环境。因此,汽车厂商需要一种快速、准确的方式来了解消费者需求。

任务描述:参赛队伍需要对文本内容中的讨论主题和情感信息来分析评论用户对所讨论主题的偏好。讨论主题可以从文本中匹配,也可能需要根据上下文提炼。

数据特色:数据为用户在汽车论坛中对汽车相关内容的讨论或评价。

05

赛题名称:《供应链需求预测》

出题单位:执御

技术方向:数据挖掘、定论预测

赛题背景:在大数据和人工智能技术快速发展的新时代背景下,运用大数据分析和算法技术,精准预测远期的商品销售,为供应链提供数据基础,建立出海企业全球化供应链方案提供技术支持。

任务描述:考虑商品在制造,国际航运,海关清关,商品入仓的供应链过程,实际的产品准备时长不同,将问题简化为统一在45天内完成,供应链预测目标市场为沙特阿拉伯,预测45天后5周每周(week1~week5)的销量。

数据特色:数据来源于平台沙特阿拉伯市场的历史数据积累,数据时间跨度为2017年3月1日至2018年3月16日数据。

06

赛题名称:《互联网金融平台用户评价观点提取》

出题单位:中科天玑 & 中科院计算技术研究所

技术方向:信息抽取,自然语言处理

赛题背景:近年来互联网金融野蛮发展,大大小小的网贷、理财平台如雨后春笋般涌现,但平台有良莠,一大批问题平台纷纷关闭、跑路,对于普通投资者来说很难来判断。如果能够借助机器学习的手段从海量的用户评论数据中提取出用户对于这个平台的评价,对投资者来说很有帮助。

任务描述:参赛者根据用户评论数据进行分析,提取用户对于平台的评价或印象,要求相同或相似评价进行聚合处理。同时,分析新闻事件对用户评论观点随时间变化的影响。

数据特色:评论数据来源于爬取的互联网金融平台评论数据,共14万条,每一条包括:评论ID,评论内容,评论时间,平台名称,用户名称等。新闻数据来源于网页、微信、BBS、手机app、论坛、电子报等。

---------------------------------------------------------------------------

第二赛道

01

赛题名称:《基于视频的可移动物体实例分割》

出题单位:百度

赛题背景:自动驾驶是当前科研和产业界非常重要的项目,而环境感知是自动驾驶众多关键技术之一,此赛题的目的是推动在环境感知问题中计算机视觉和机器学习算法的科研水平,可以让自动驾驶相关的应用都有所受益,包括但是不限于2D/3D场景解析、定位、迁移学习和驾驶仿真。

任务描述:赛题要求参赛者为自动驾驶开发新颖独特的算法和框架,任务的目的是评估当前先进的基于视频的物体分割算法。

数据特色:用于当前赛题的数据集开放了近九万帧具备可移动物体实例标注的视频图像。

难度与挑战:

1、 缺乏公开的视频上精细标注的数据集

2、 ApolloScape具备更高的场景复杂度

3、 ApolloScape具备更为多样性的光照条件,晴天,阴天,背光,以及立交桥下两级分化的光照效果等。

赛题赛程:

赛题&数据发布:

2018年9月26日12:00:00

可查看赛题信息,开放报名组队;可下载赛题数据,开放作品评测

大赛初赛-A榜:

2018年9月26日12:00:00-2018年11月8日23:59:59

可持续报名,作品实时评测

大赛初赛-B榜:

2018年11月9日12:00:00-2018年11月11日23:59:59

作品定时评测

决赛入围审核:

2018年11月12日00:00:01-2018年11月15日23:59:59

反作弊工作展开,复核后每道题Top5入围决赛

大赛决赛:

2018年11月24日-2018年11月25日

数据科学家论坛,答辩评审,颁奖典

02

赛题名称:《视频中人体姿态识别》

出题单位:零点有数

赛题背景:姿态识别的应用场景不仅包括关键点定位,如图形(Graphics),增强显示(Augmented Reality, AR),人机交互(Human-Computer Interaction,HCI),还包括 3D 目标识别的很多方面。因此在行为识别、人机交互、游戏、动画等领域有着广阔的应用前景。例如游戏领域的体感类游戏; 安全领域的家庭监控,通过监控识别出特殊的人体姿态,以便及时作出响应。

任务描述:赛题提供6段不同场景下的视频(视频源来自于互联网某视频类网站),要求参赛者针对提供的视频进行姿态识别。

难度与挑战:

1、 背景复杂多变

2、 人体的肢体运动比较灵活

3、 视角的变化

4、 衣着的变化

赛题赛程:

赛题&数据发布:

2018年9月26日12:00:00

可查看赛题信息,开放报名组队;可下载赛题数据,开放作品评测

大赛初赛:

2018年9月26日12:00:00-2018年11月11日23:59:59

可持续报名并提交作品,初赛后专家集中评测

决赛入围审核:

2018年11月12日00:00:01-2018年11月15日23:59:59

反作弊工作展开,复核后每道题Top5入围决赛

大赛决赛:

2018年11月24日-2018年11月25日

数据科学家论坛,答辩评审,颁奖典礼

03

赛题名称:《基于GPU服务器的图数据三角形计数算法设计与性能优化》

出题单位:北京费马科技

赛题背景:大数据时代,对关联(图)数据的处理被广泛应用于社交网络、智能交通、移动网络等领域。对图数据的三角形计数被广泛应用于图数据的特征描绘(如聚集系数、联通度等)、社区结构检索、子图匹配、生物网络等应用。

赛题任务:在给定服务器平台,以及数据集上实现三角形计数(Triangle Counting,TC)算法,调试并获得最高的性能。三角形的定义是一个包含三个顶点的子图,其中顶点两两相连。例如,以下的无向图中包含2个三角形。

注:算法应着重讨论简单无向图的情形,即将重边(multi-edge)看成一条边,同时应不考虑loop(顶点指向自己的边)。如在上图中,若存在顶点1到3的两条边,则应忽略其中一条,这样,结果仍然是找到2个三角形。在本赛题的数据集中,也应将有向图看成是无向图。

赛题赛程:

赛题&数据发布:

2018年9月26日12:00:00

可查看赛题信息,开放报名组队;可下载赛题数据,开放作品评测

大赛预赛:

2018年9月26日12:00:00-2018年10月14日23:59:59

可持续报名并提交作品,每周一将会对前一周提交作品进行统一评测,并更新排行榜,满足作品要求即可提前进入正式比赛

大赛正式比赛:

2018年10月15日12:00:00-2018年11月11日23:59:59

报名截止,可持续提交作品,每周一将会对前一周提交作品进行统一评测,并更新排行榜

决赛入围审核:

2018年11月12日00:00:01-2018年11月15日23:59:59

反作弊工作展开,复核后正式比赛最后一周排行榜Top5入围决赛

大赛决赛:

2018年11月24日-2018年11月25日

数据科学家论坛,答辩评审,颁奖典礼

04

赛题名称:《大规模分布式多路Join查询优化》

出题单位:深鉴科技

赛题背景:大数据时代,各行各业大数据分析处理需求不断增长,作为大数据分析应用中最为常用的技术之一,大数据查询分析吸引了学术界和工业界的广泛关注。在大数据查询分析技术中,多路Join查询在许多大数据分析场景中扮演着重要的角色。然而,在大数据分布式存储模式下,已有的单机多路Join查询算法并不适用,因此,需要研究高效的分布式多路Join查询算法。本赛题旨在基于大数据分布式计算引擎Apache Spark,对分布式多路Join算法进行优化,进而提升分布式多路Join查询的性能。

任务描述:本赛题中每个数据集分别包含两个具体的多路Join查询分析任务。通过不同的查询任务来综合评价选手们设计的分布式多路Join查询算法。

(1)基于TPC-DS的多路Join查询任务

基于TPC-DS的多路Join查询任务包含Query17和Query25,这两个查询任务均为涉及到8张表的多路Join查询。Query 17和Query25对应的SQL语句可查看附录。

(2)基于LiveJournal数据集的多路Join查询任务

LiveJournal数据集只包含一张好友关系表,因此相关的所有多路Join查询任务都是self-join。另外,由于LiveJournal的好友关系表是有向的,故所有的多路Join查询任务也都是有向的。基于LiveJournal数据集的两个多路Join查询任务如下所示:

查询任务一:列举出LiveJournal社交网络中所有的有向四边形(directed rectangle)。该查询是一个四路Join查询,其对应的查询结构如图1(a)所示。图中的顶点表示LiveJournal中用户ID,该结构的含义:构成循环好友关系的四用户对(a-b-c-d-a)。

      查询任务二:列举出LiveJournal社交网络中如图1(b)所示的结构。该查询是一个七路Join查询,该结构的含义:给定两组构成循环好友关系的三用户对(a-b-c-a与f-d-e-f),其中一组中的某用户和另外一组中的某用户是好友关系,如c和d。

难度与挑战:

与单机多路Join查询相比,大规模分布式多路Join查询与优化具有更高的技术挑战性,不仅需要考虑Join过程中的计算开销,还需要考虑计算节点间的数据传输与通信开销。

赛题赛程

赛题&数据发布:

2018年9月26日12:00:00

可查看赛题信息,开放报名组队;可下载赛题数据,开放作品评测

大赛初赛:

2018年9月26日12:00:00-2018年11月11日23:59:59

可持续报名并提交作品,每周一将会对前一周提交作品进行统一评测,并更新排行榜

决赛入围审核:

2018年11月12日00:00:01-2018年11月15日23:59:59

反作弊工作展开,复核后初赛最后一周排行榜Top5入围决赛

大赛决赛:

2018年11月24日-2018年11月25日

数据科学家论坛,答辩评审,颁奖典礼


截止目前,大赛已吸引来自573家企事业单位、445所高校的8147人参赛,成为2018年最值得参与的大数据竞赛之一!

现邀请各研究院、高校老师共同合作,将教学与BDCI结合,为学子创造更多实践机会,将大赛推向新高度。

组委会将邀请相关企业高管和CCF知名专家走进高校,为学生讲解大数据和人工智能技术、行业发展现状及赛题。

同时会为高校任课老师单独开放大数据训练习题私密链接(包含数据集),供学生进行实践练习。

合作形式

授课教师将CCF BDCI 以班级大作业形式布置给班级学生,鼓励学生组队配合完成赛事挑战。

合作权益

1、 单所高校超过三位教师报名,我们会邀请相关企业高管和CCF知名专家前往该校进行赛事宣讲,对学生进行大数据知识及技能培训、行业分享、问题答疑等。

2、 大赛组委会将高校列为支持单位,并享受相关权益,并为高校颁发优秀组织奖项,与队伍指导教师建立长期合作关系。

3、 大赛组委会与高校建立高校奖励机制,通过排行榜筛选出高校优秀队伍进行奖励。

4、 大赛组委会为高校提供校招企业,或提供培训保障学生就业。

5、 大赛组委会鼓励以实验室命名的形式报名参赛,获奖后组委会会给与额外的奖励。

6、 大赛组委会为高校排名优异队伍办理CCF会员。

7、 大赛组委会为高校提供宣传物料支持。

8、 赠送决赛颁奖&晚宴参会名额。

参赛报名链接:https://www.datafountain.cn/competitions?utm_source=18mcfa1&utm_dedium=WeChat&utm_campaign=bdci2018

高校合作联系人:17611210220 李老师